智能论文笔记

KnowGL: Knowledge Generation and Linking from Text

Gaetano Rossiello , Faisal Chowdhury , Nandana Mihindukulasooriya , Owen Cornec , Alfio Gliozzo

分类：自然语言处理 | 人工智能

2022-10-25

We propose KnowGL, a tool that allows converting text into structured relational data represented as a set of ABox assertions compliant with the TBox of a given Knowledge Graph (KG), such as Wikidata. We address this problem as a sequence generation task by leveraging pre-trained sequence-to-sequence language models, e.g. BART. Given a sentence, we fine-tune such models to detect pairs of entity mentions and jointly generate a set of facts consisting of the full set of semantic annotations for a KG, such as entity labels, entity types, and their relationships. To showcase the capabilities of our tool, we build a web application consisting of a set of UI widgets that help users to navigate through the semantic data extracted from a given input text. We make the KnowGL model available at https://huggingface.co/ibm/knowgl-large.

translated by 谷歌翻译

Re2G: Retrieve, Rerank, Generate

Michael Glass , Gaetano Rossiello , Md Faisal Mahbub Chowdhury , Ankita Rajaram Naik , Pengshan Cai , Alfio Gliozzo

分类：自然语言处理 | 人工智能

2022-07-13

正如GPT-3和T5所证明的那样，随着参数空间变得越来越大，变压器具有能力。但是，对于需要大量知识的任务，非参数存储器允许模型在计算成本和GPU内存需求的次线性增加中急剧增长。诸如RAG和Realm之类的最新模型已将检索引入条件生成。这些模型结合了从一系列语料库中的神经初始检索。我们基于这一研究，提出了RE2G，该研究将神经初始检索和重新融合到基于巴特的序列到序列的生成中。我们的阅读方法还允许从无与伦比分数的来源合并结果，从而实现BM25和神经初始检索的合奏。为了训练我们的系统端到端，我们引入了一种新颖的知识蒸馏变体，以在目标序列输出上仅使用地面真理来训练初始检索，重读者和生成。我们在四个不同的任务中发现了很大的收益：零击插槽填充，问答，事实检查和对话，相对增长了9％至34％，比以前的苏格兰短裙排行榜上的最先前的排行榜相比。我们将代码作为开源提供，网址为https://github.com/ibm/kgi-slot-filling/tree/re2g。

translated by 谷歌翻译

Knowledge Graph Induction enabling Recommending and Trend Analysis: A Corporate Research Community Use Case

Nandana Mihindukulasooriya , Mike Sava , Gaetano Rossiello , Md Faisal Mahbub Chowdhury , Irene Yachbes , Aditya Gidh , Jillian Duckwitz , Kovit Nisar , Michael Santos , Alfio Gliozzo

分类：人工智能 | 自然语言处理

2022-07-11

研究部门在组织中推动创新的重要作用。随着速度和量的信息增长，绘制见解，跟随趋势，保持新的研究以及制定策略的配制策略越来越越来越具有挑战性。在本文中，我们介绍了一个用例，即公司研究界如何利用语义网络技术来诱导从结构化和文本数据中诱导统一的知识图，通过整合与研究项目相关的社区使用的各种应用程序，学术论文，学术论文，数据集，成就和认可。为了使应用程序开发人员更容易访问知识图，我们确定了一组通用模式，用于利用诱导的知识并将其视为API。这些模式是从用户研究中诞生的，这些模式确定了最有价值的用例或用户疼痛点要缓解。我们概述了两个不同的方案：用于业务使用的建议和分析。我们将详细讨论这些方案，并针对实体建议提供经验评估。所使用的方法和从这项工作中学到的教训可以应用于面临类似挑战的其他组织。

translated by 谷歌翻译

KGI: An Integrated Framework for Knowledge Intensive Language Tasks

Md Faisal Mahbub Chowdhury , Michael Glass , Gaetano Rossiello , Alfio Gliozzo , Nandana Mihindukulasooriya

分类：自然语言处理 | 人工智能 | 机器学习

2022-04-08

在本文中，我们介绍了一个系统，以展示最新的最新检索增强生成模型的功能，该模型接受了知识密集型语言任务的培训，例如插槽填充，开放式域问题答案，对话和事实检查。此外，鉴于用户查询，我们显示如何将这些不同模型的输出组合在一起以互相盘问彼此的输出。特别是，我们展示了使用问题答案模型如何提高对话的准确性。我们还将发布演示中使用的所有模型作为本文的贡献。一个简短的视频，展示了该系统，请访问https://ibm.box.com/v/emnlp2022-demo。

translated by 谷歌翻译

Semantic Answer Type and Relation Prediction Task (SMART 2021)

Nandana Mihindukulasooriya , Mohnish Dubey , Alfio Gliozzo , Jens Lehmann , Axel-Cyrille Ngonga Ngomo , Ricardo Usbeck , Gaetano Rossiello , Uttam Kumar

分类：自然语言处理 | 人工智能

2021-12-07

每年国际语义网络会议组织一套语义网络挑战，以建立将在一些问题领域推进最先进的解决方案的竞争。语义答案类型和关系预测任务（SMART）任务是ISWC 2021语义网络挑战之一。这是在ISWC 2020成功智能2020后的挑战的第二年。今年的版本侧重于两个对知识库问题应答（KBQA）的非常重要的子任务：答案类型预测和关系预测。问题类型和答案类型预测可以在知识库问题应答系统中发挥关键作用，提供关于有助于生成正确查询或排名答案候选人的预期答案的见解。鉴于自然语言的问题更具体地说，第一个任务是使用目标本体预测答案类型（例如，DBPedia或Wikidata。类似地，第二个任务是识别自然语言查询中的关系并将它们链接到目标本体中的关系。本文讨论了任务描述，基准数据集和评估指标。有关更多信息，请访问https://smart-task.github.io/2021/。

translated by 谷歌翻译